TF-IDF算法相关论文
为提升铁路信号设备的故障处理效率,在对故障文本信息分析的基础上,提出一种基于关联规则的铁路信号设备故障诊断方法。由于故障文本......
“全面建成小康社会,残疾人一个也不能少”,是习近平总书记对残疾人这个特殊群体格外关心、关注的具体体现,同时也是对脱贫攻坚、......
随着以UGC为主要特征的Web2.0的发展,越来越多的游客可以通过互联网随时随地分享自己的旅游行程路线、对旅游目的地的体验,在线评......
做好高校舆情分析与预警具有重要的社会意义,针对传统的网络舆情分析方法依靠人工筛选,费时费力、准确度低且无法进行海量数据分析的......
随着计算机和互联网技术的发展,网络安全问题日益突出,入侵检测系统是维护网络安全的重要手段。目前,入侵检测系统中所开发的模型......
在新冠疫情仍然在全世界流行的背景下,即使新冠疫情在我国得到了有效的控制,但因新冠病毒为易感病毒,一旦感染发病,可能会发展为重......
随着深度神经网络技术的发展,基于领域文本数据集训练得到的深度神经网络模型逐渐应用到社会各个领域,用来解决各个领域中的实际问......
函数名称预测是代码分析中的一项重要下游任务。优秀的函数名称可以增加程序或者代码的可理解性,帮助开发人员轻松的理解他人的代......
在当今信息化基础建设相对成熟的新时代,政企事业单位的管理不断精细化和精确化,加之其规模不断扩大、任用制度不断改进,人才的信......
随着互联网技术的发展,教育理念的变革,用户教育需求的升级和生活方式的转变,中小学在线教育的市场规模大幅度增长.尤其在2020年,......
文本挖掘是处理海量文本数据最重要的技术手段之一。随着信息技术和社会各行各业的发展,相关的信息资源和论文研究数据的爆炸式增......
城市功能区的动态监测可为城市空间结构分析、公共资源的配置以及城市规划提供决策支持。利用POI数据进行城市功能区的识别,多侧重......
[摘 要]为了维护卷烟产品质量和把握消费者关注热点,通过在线问卷调查获取消费者抽吸感知评价数据,并从消费者满意度、评论热度和文......
社交网络是近几年来迅速崛起的一类新型Web服务。Twitter和新浪微博是第二代社交网络,即微博服务的代表。随着移动互联网的发展,微......
目前,数据管理呈现出海量、异构、分布、共享等新的特点,传统的数据管理系统己无法满足当今用户的需求,为此,Michael Franklin等人......
作为互联网的重要入口,搜索引擎地位不言而喻而众多搜索引擎有着同样的外表,搜索结果严重同质化个性化搜索引擎通过为用户建立兴趣模......
目前,医院的人工导医分诊台由于患者的咨询不断增多,患者与导诊医生有效的交流时间减少,患者难以得到详细的解答,因而,人工导医已......
随着网络上的数据爆炸式地增长,以及大量图数据的产生,图上的关键词查询得到了学术界的高度关注。图上的关键词查询算法不同于其他......
网络发展迅速,网页数量越来越庞大,人们为了获取需要的信息,往往需要翻阅大量的网页,浪费时间和精力,并且还不一定能够获取最新最......
微博热点话题发现是指从大量微博中挖掘出话题,并根据话题热度评估方法选出热点话题。它可以帮助人们从海量的信息中,便捷地选出用......
随着web技术和信息技术的快速发展,如何从结构来源复杂的数据海洋中进行信息抽取和信息检索一个困难而又有重要实际用途的研究课题......
随着互联网的发展和普及,医疗服务类网站越来越多,功能也更加的智能化,网上挂号功能也得到了普遍应用,用户可以不出家门就能在网上预约......
摘要:[目的/意義]在舆情领域,通过对已知主题生命周期演化轨迹的分析、热点与非热点主题演化过程的对比,可以更好地把握热点主题演化......
研究表明,关键蛋白质的识别不仅有助于理解细胞的生长调控过程,也有助于进行疾病研究和药物设计。但是通过生物医学实验的方法成本......
随着我国汽车保有量持续增多,汽车故障投诉数量不断上升。而现有汽车故障诊断技术由于时效性差、成本高、效率低等因素无法很好地......
随着国家教育部提出建设“双一流”高校与学科的战略之后,越来越多教育界人士参与到了这一伟大的历史征程中。从学校到学者都明白......
政府的支出责任是政府履行事权的支出义务和保障,党的十八届三中全会明确提出要推进基本公共服务均等化,在政府职能转为服务型政府......
随着“互联网+”教育的快速发展和“三通两平台工程”的实施,网络教育资源越来越丰富,如何快速高效查找到相关的优质教育资源是一......
随着互联网的产生及其迅速发展,网络已逐渐融入进人们工作和生活当中。与此同时,用户行为分析也应运而生,为网络信息的挖掘和分析......
伴随着WWW的发展,基于WWW的信息获取技术——搜索引擎技术出现并得到迅速发展。由于互联网的开放性,使搜索引擎可以面向普通用户,用户......
随着智能移动设备的使用在世界各地不断扩大,其应用领域变得愈加广泛,如个人通信、数据存储、娱乐休闲等。正如PC端应用所暴露的安全......
国家主席习近平致国际教育信息化大会的贺信中指出,要建设“人人皆学、处处能学、时时可学”的学习型社会,用信息技术的发展,推动......
针对传统分词算法、传统提取关键词算法对现代营销活动中以客户为中心,分析客户评论,提取重要客户的需求具有局限性等问题,提出融......
网站已成为高校发布学术活动通知的主要平台,能否从中准确抽取相关信息并进行分类,直接影响着办公自动化的效率。为了实现文本分类......
为了克服传统的CHI统计方法存在特征项出现频率与类别负相关的情况和某一个特征项存在于某一个文本中的概率问题,针对传统的CHI统......
为有效地分析患者对医院的评价,本文提出利用机器学习算法对文本的情感进行分析,该算法利用TF-IDF(term frequency–inverse docum......
随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求。据此,论文提......
首先基于某电信公司2014年度的AAA服务日志文件,统计了其认证结果的比例分布,归纳了导致服务状态异常的数据源行为类型,即恶意登录......
面向患者的智能导医系统通过人工智能技术,依据患者症状计算可能疾病,引导患者准确挂号。目前智能导医系统多采用患者输入描述自身症......
文中提出了一种基于ElasticSearch分布式搜索引擎文本相似度比对优化方案,该方法在ElasticSearch搜索引擎自身文本比对模型(TF-IDF......
近年来,国内人民的生活水平在不断的提高,互联网迅速的发展起来,并且出现在人们生活的各个领域中,导致网络用户的数量大大增加。本文通......
传统TF-IDF算法仅从词频与逆向文档频率的角度计算关键词与文档之间的相关性权重,忽略了用户兴趣对权重计算的影响。为此,以满足用......
针对多示例多标记学习算法MIMLBoost中退化过程造成的类别不平衡问题,运用人工降采样思想,引入类别重要度,提出一种改进的基于类别......
随着社会经济的发展,教育资源不平衡的情况正在愈演愈烈。很多地区的适龄儿童因为没有合适的经济条件和物质基础,就难以享受到良好......
随着网上信息的极大丰富,文本分类技术显得越发重要,且预处理技术已成为文本分类的瓶颈.在预处理中采用TF-IDF算法,并且根据基尼指......
面向服务系统的执行能力依赖第三方提供的服务,在复杂多变的网络环境中,这种依赖会带来服务质量(QoS)的不确定性.而QoS是衡量第三方服务......
期刊
现代工程项目参与单位多、项目地点分散、建设周期长等特点,使得在项目建设过程中,管理者对管理信息的获取和分析存在诸多困难。对......